AI 在科研领域的新应用

本问灵感来自经济学人的How artificial intelligence can revolutionise science 文中对未来AI 在科学研究的应用做了两个预测，一个是基于文献的发现(Literature-based discovery)，另外一个是机器人科学家 (Robot Scientist)，本文，再深入聊聊.

首先，要知道其实科学界一只在拥抱新技术，当然也包括AI.

已经在用AI技术

科学界已经在大量使用了AI技术了，根据研究 2022 年的数据 7.2% 物理及天研究论文使用了AI，其他领域也有１.4% 到 7.2% 不等。以下是几个常见的领域以及它们是怎么使用AI的：

蛋白质折叠的预测

科学家利用深度学习技术，通过训练神经网络模型，可以预测蛋白质的三维结构。核心原理是：通过输入蛋白质的氨基酸序列，神经网络模型会学习到不同氨基酸之间的相互作用和结构规律，进而预测出蛋白质的折叠方式和三维结构。

基因编辑

科学家正在利用AI技术进行基因编辑的研究和应用。核心原理是: 通过使用AI技术，科学家可以分析大规模的基因组数据，并通过机器学习算法识别和预测基因编辑的目标位点。AI还可以帮助设计适合特定目的的编辑工具和方法，从而提高基因编辑的效率和准确性。这项技术的应用潜力非常广泛，可用于基因疾病的治疗、农作物的改良、生物能源的生产等领域。

疾病诊断和预测

在医学通过学习标记过医学影响，可以辅助医生诊断疾病。

天文观察的数据处理

通过AI技术，科学家能够对天文观测数据进行高效处理和分析。AI算法可以帮助自动识别和分类天体，发现新的天体现象，以及识别和分析天体图像中的特征和模式。这有助于科学家更好地理解宇宙的演化和结构，推动天体物理学的研究进展。

除了以上没说到还还有很多比如材料和合成的设计，基因组数据的分析和解读，以及环境监测和预测等方面都在科学界广泛应用AI技术。原文作者提到的两个应用领域可能可以从更基础的层面上，推进科学研究的进展。

基于文献的发现(Literature-based discovery)

科学文献中存在着潜在的隐含知识和关联，这些知识和关联可以通过分析和挖掘文献来揭示。LBD认为，文献不仅仅是表达已知知识的载体，还可以作为发现新知识和关联的源泉。尽管文献中的知识通常是基于先前研究的结果，但文献中存在着未被充分利用或发现的信息，这些信息可能会导致新的发现。LBD基于这一假设，通过分析和整合文献中的信息，寻找不同领域和概念之间的联系，以揭示未被发现的关联和知识。一个LBD基本的研究范式 ABC paradigm：

早在 20 世纪 80 年代，为寻找医学期刊数据库 MEDLINE 中的新关联，芝加哥大学的 Don Swanson 博士就建立了第一个 LBD 系统。这个研究最基础的范式叫 ABC paradigm 。其中： A 表示一个已知的问题或领域，即已有的已知知识（Known Knowledge）。 B 表示一个已知的概念或主题，即与问题相关的已知概念（Known Concepts）。 C 表示一个未知的关联，即未被发现的关联或新的发现（Discoveries）。基于文献的发现的目标就是通过找到 A 和 B 之间的潜在关联来揭示 C。通过分析文献，研究者会识别已知的概念（B），并试图找到与这些概念关联的其他领域或问题（A）以发现新的关联（C）。

ABC paradigm 可以帮助研究者快速定位和识别可能的未探索关联，从而引发新的研究方向和创新发现。这一方法的早期成功之一体现在将雷诺氏病（一种循环系统疾病）与血液黏度相关联，并提出鱼油可能对治疗有用的猜想。

AI 结合 LBD 的可能的新用法

类似ChatGPT 的大语言模型(LLM) ,不但，可吸收以往的人类知识成果，也可以快速吸收理解最新的研究成果，来为为科研人员：

给出更多的研究路线
提供跨领域的研究建议
发现被忽视的关联
提供新的研究假设和创新思路

机器人科学家 (Robot Scientist)

还有一个应用领域是：机器人科学家 (Robot Scientist)。机器人科学家是指：通过机器人和人工智能技术来进行科学实验和研究的系统。机器人科学家可以建立假设，再自动执行一系列实验，收集数据，分析结果，并据此生成新的科学假设和洞察。

机器人科学家的一个重要应用领域是药物发现和化学领域。为了找到新的药物，往往需要提出大量的假设，每种假设还需要做大量重复的实验和筛选工作，这些工作对于人类来说既耗时又耗力。借助机器人科学家，可以实现实验的自动化及实验规模横向拓展，从而加速药物发现的过程。

在以往往的人类研究中，可能了出于，经验，成本，效率方面考虑，探索的假设空间可能只是所有可能空间的一小部分，如果 AI 能够探索整个假设空间，甚至扩大这个空间，通过自动化遍历所有假设空间和发现新的关联，机器人科学家有望推动科学研究的进一步发展。机器人科学家能够以非常高效和准确的方式进行大规模的实验和数据分析，从而识别出以往被忽视或未能发现的关联和知识。这种能力将帮助科学家们更全面地理解问题，并提出新的假设和解释。

早期实践

亚伯大学的“Adam”是机器人科学家的先驱，它首次实现了自主发现新的科学知识，关于酵母代谢中基因和酶之间关系的实验是一个典型案例。

“Eve”，在计划和分析实验时，它使用机器学习创建“定量构效关系”（QSARs）——将化学结构与生物效应相关联的数学模型。Eve 已经用于药物发现，成功地发现了一种用于牙膏中的抗微生物化合物三氯生（triclosan）可以抑制引发疟疾的寄生虫中的关键机制。

总结

机器人科学家和基于文献的发现方法有望实现更加全面和全局的知识发现。它们可以突破人类的认知限制，从不同的角度和维度来分析和解释科学文献，并发现人类可能忽视或未能发现的关联和知识。这将极大地推动科学研究的进展，加速新的发现和突破，提供更多的研究方向和创新思路。通过探索整个假设空间，AI有望带来更开阔的视野和全新的科学见解，为未来的科学发展和知识进步带来重要的推动力。

参考：

https://m.huxiu.com/article/1884120.html

https://zhuanlan.zhihu.com/p/642293473

https://hub.baai.ac.cn/view/19780

https://www.36kr.com/p/2437340871709059

https://www.economist.com/leaders/2023/09/14/how-artificial-intelligence-can-revolutionise-science

https://en.wikipedia.org/wiki/Literature-based_discovery

https://en.wikipedia.org/wiki/Robot_Scientist